草庐IT

php - UTF-8 与 PHP DOMDocument loadHTML?

全部标签

ruby-on-rails - 在 RoR 中对 UTF-8 字符串进行排序

我正试图找出一种在RubyonRails中对UTF-8字符串进行排序的“正确”方法。在我的应用程序中,我有一个填充了国家/地区的选择框。由于我的应用程序已本地化,每个现有的语言环境都有一个countries.yml文件,该文件将国家的ID与该国家/地区的本地化名称相关联。我无法在yml文件中手动对字符串进行排序,因为我需要ID在所有语言环境中保持一致。我所做的是创建一个使用unidecode的ascii_name方法gem将重音字符和非拉丁字符转换为对应的ascii字符(例如,“Afeganistão”将变为“Afeganistao”),然后对其进行排序:require'unideco

ruby-on-rails - 为什么我会收到从 ASCII-8BIT 到 UTF-8 的字符串编码问题 "\xE2"?

我正在尝试从电子邮件下载PDF并将内容写入文件。出于某种原因,我收到此错误:AnEncoding::UndefinedConversionErroroccurredinattachments#inbound:"\xE2"fromASCII-8BITtoUTF-8app/controllers/api/attachments_controller.rb:70:in`write'这是我的代码:definboundifRails.env.production?orRails.env.staging?email=Postmark::Mitt.new(request.body.read)else

ruby - 在 Heroku 中将 UTF-8 设置为默认字符串编码

我需要在Heroku中将默认的ruby​​字符串编码更改为UTF-8。由于某种原因,它是US-ASCII。$herokuconsoleRubyconsoleformyapp.heroku.com>>"a".encoding=>#但是,如果我在本地运行irb,我会得到不同的结果:$irbruby-1.9.2-p136:001>"a".encoding=>#两者都在ruby​​1.9.2上运行。我也试过设置这个,但没用:Encoding.default_internal=Encoding.default_external="UTF-8"想法?谢谢,菲利普 最佳答

ruby - 如何在 Ruby 中删除 4 字节的 utf-8 字符?

由于MySQL的utf8不支持4字节字符,我正在寻找一种方法来检测和消除Ruby字符串中的任何4字节utf8字符。我知道我可以更新我的表以使用utf8m4,但由于一些不可能或所需的解决方案的原因。简单地将字符串编码为ASCII会删除这些字符,但也会删除所有其他非ASCII字符,这并不好。 最佳答案 以下似乎适用于Ruby1.9.3:input.each_char.select{|c|c.bytes.count例如:input="hello\xF0\xA9\xB6\x98world"#includesU+29D98input.each

ruby - UTF-8 中的无效字节序列 (ArgumentError)

我正在尝试运行Ruby脚本,但总是在这一行出现错误:file_content.gsub(/dr/i,'med')我试图用“med”替换“dr”的地方。错误是:program.rb:4:in`gsub':invalidbytesequenceinUTF-8(ArgumentError)这是为什么,我该如何解决这个问题?我正在使用Ruby2.2.1p85的MACOSXYosemite机器上工作。 最佳答案 可能你的字符串不是UTF-8格式,所以使用if!file_content.valid_encoding?s=file_content

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列?

我有一个Rails应用程序从Rails版本1开始迁移,我想忽略它上面的所有无效字节序列,以保持向后兼容性。我不知道输入编码。例子:>"-Men\xFC-".split("n")ArgumentError:invalidbytesequenceinUTF-8from(irb):4:in`split'from(irb):4from/home/fotanus/.rvm/rubies/ruby-2.0.0-rc2/bin/irb:16:in`'我可以在一行中解决这个问题,例如:>"-Men\xFC-".unpack("C*").pack("U*").split("n")=>["-Me","ü-

如何在PHP中动态获取页面标题

我获得了我的主页标题,但是在获取内部页面(可变帖子)方面,它不起作用。$path=$_SERVER['PHP_SELF'];$page_title=basename($path);switch($page_title){case'index.php':$title="Welcometothethewebsite";$description="descriptiongoeshere";break;case'about.php':$title="Welcometothethewebsite";$description="somehtinfd";break;case'career.php':$tit

ruby `split' : invalid byte sequence in UTF-8 (ArgumentError)

我正在尝试填充电影对象,但在解析u.item文件时出现此错误:`split':invalidbytesequenceinUTF-8(ArgumentError)File.open("Data/u.item","r")do|infile|whileline=infile.getsline=line.split("|")endend仅当尝试使用花哨的国际标点符号拆分行时才会发生错误。这是一个例子543|Misérables,Les(1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Mis%E9rables%2C%20Les%20%281

UTF-8 中的 Ruby 无效字节序列

我有以下代码,它给了我一个指向扫描方法的无效字节序列错误initialize.有想法该怎么解决这个吗?对于它的值(value),错误不会在(.*)时发生。在h1标签和结束>之间不存在。#!/usr/bin/envrubyclassNewsParserdefinitializeDir.glob("./**/index.htm")do|file|@file=IO.readfileparsed=@file.scan(/(.*?)(.*)/im)self.write(parsed)endenddefwriteoutput@contents=outputopen('output.txt','a'

ruby 1.9 : Convert byte array to string with multibyte UTF-8 characters

我正试图在Ruby中找到一种方法来获取UTF-8字节数组并将其转换回字符串。在irb(Ruby1.9.2预览版3)中,我可以从UTF-8字符串创建正确的字节数组:ruby-1.9.2-preview3>'Café'.bytes.to_a=>[67,97,102,195,169]但是,我找不到从字节返回数组的方法。我尝试将Array.pack与U*选项一起使用,但这不适用于多字节字符。ruby-1.9.2-preview3>[67,97,102,195,169].pack('U*')=>"Café"有没有人知道如何将包含多字节字符的UTF-8字节数组转换回字符串?谢谢。